llm

LLM的关键转折:LAM,究竟是什么?

操作 Windows 程序、自动对账发票、预订航班和酒店——这些只是新一代大型语言模型(LLMs)为 AI 智能体带来的众多可能性中的几个。研究人员将这一阶段的进化称为“大型行动模型(Large Action Models)”,简称 LAMs。

智能体 llm rpa gui lam 2025-06-25 14:40  9

读创今日荐书 | 如何理解大模型底层技术?

全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分“理解语言模型”,解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分“使用预训练语言模型”,介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成

模型 llm 荐书 杰伊 多斯特 2025-06-23 20:34  8

从零开始200行python代码实现LLM

本文尝试从零开始,用python实现一个极简但完整的大语言模型,在过程中把各种概念“具象化”,让大家亲眼看到、亲手写出self-attention机制、transformer模型,亲自感受下训练、推理中会遇到的一些问题。

代码 llm python idx python代码 2025-06-20 19:35  10

大模型火了之后,这本书更像圣经了

在这个到处是大模型和深度学习的时代,很多人都开始怀疑,传统的强化学习方法是不是已经过时了。但 Sutton 的回应恰恰说明了一个核心问题:你越是在“黑盒”盛行的年代,越需要掌握最基本的原理。

模型 llm gym rl 圣经 2025-06-21 12:31  8

大模型为何难成为「数学家」?

数学证明不仅要得出 “对” 的答案,更要给出逻辑闭合、层层严谨的推理过程。在不等式问题中尤其如此 —— 哪怕最终答案是对的,只要中间某一步出现纰漏,整个证明就可能不成立。我们不禁提问:这些答案是模型通过严密推理得出的,还是只是通过 “看起来合理” 的过程猜出来

模型 gemini 推理 llm 数学证明 2025-06-22 20:53  7

从“中国市场”到“中国定义”

最近,一只有着圆眼睛、尖耳朵、长着獠牙的小精灵火遍全球,她就是由泡泡玛特出品的潮玩产品LABUBU。在被HelloKitty、Bearbrick等海外IP主导了几十年的潮玩市场,中国品牌正在慢慢成为一股不可忽视的力量。

llm 潮玩 玛特 labubu rce 2025-06-20 17:30  8

企业级语言模型自托管优秀实践

大型语言模型(LLMs)随处可见,从日常应用到高级工具都可以看到他们的身影。虽说使用起来很容易,但如果要运行自己的模型就是另外一回事了。比如对模型进行微调并处理了一些隐私敏感数据,复杂性就会增加。在这篇文章中,我们将分享在构建我们自己的 LLM 推理系统时所学

模型 llm 语言 rabbitmq sse 2025-06-20 17:23  8

AI Agent 安全警钟敲响:风险凸显

在当今数字化浪潮汹涌的时代,人工智能技术以前所未有的速度蓬勃发展,AI Agent(人工智能智能体)作为其中的前沿应用,正逐渐走进人们的生活与工作。它不再仅仅是简单的智能对话程序,而是具备了看听读写、执行具体任务的强大能力,宛如一位不知疲倦的数字助手,为人们带

llm agent aiagent mcp 警钟 2025-06-18 05:03  9

中科院团队自研大模型,自动设计超强芯片

处理器芯片设计技术是推动计算机科学及相关领域突破的关键前沿技术。随着信息技术的快速发展,传统的设计范式面临三大挑战:制造技术的物理约束、日益增长的设计资源需求以及生态系统的日益多样化。自动化处理器芯片设计已成为应对这些挑战的变革性解决方案。尽管人工智能(AI)

模型 芯片 llm 中科院 lpcm 2025-06-12 09:33  9

RL+search = Deep research

我之前说过chatGPT的deepresearch 做的好是因为它的DR 引擎是o3强化版本的针对过search场景RFT过,所以体验比grok和google的DR要好,后两者更像deep search或者说我们用的更像deep search

rag llm rl deepresearch ppo 2025-05-11 23:53  11